DO-02 - DevOps-мониторинг - Human Growth Kazakhstan

DO-02 - DevOps-мониторинг

DevOps

DO-02 - DevOps-мониторинг

Описание курса

Общая информация о курсе

Цель курса: Повышение компетенций сотрудников в области системного и прикладного мониторинга DevOps-инфраструктуры
Целевая аудитория: DevOps-инженеры, системные администраторы, SRE-специалисты

Предварительные требования:
Базовые знания Linux/Unix
Опыт работы с Docker и Kubernetes
Понимание концепций CI/CD

День 1: Основы DevOps-мониторинга и Observability

Теоретическая часть

Введение в DevOps-мониторинг
Концепция Observability
Основы наблюдаемости: Metrics, Logs, Traces
Различия между мониторингом и наблюдаемостью
Принципы построения наблюдаемых систем
Метрики, логи и трассировки: когда что использовать

 Архитектура мониторинга
Компоненты системы мониторинга
Сбор данных (Collectors, Exporters, Agents)
Хранение и обработка (Time Series DB, Log Aggregation)
Визуализация (Dashboards, Alerting)
Уведомления и эскалация

 Практическая часть

Лабораторная работа 1: Настройка базовой инфраструктуры
Установка и конфигурация Prometheus
Развертывание Prometheus в Docker
Базовая конфигурация prometheus.yml
Проверка работы веб-интерфейса
Изучение метрик по умолчанию

 Лабораторная работа 2: Первые метрики
Сбор базовых метрик системы
Установка Node Exporter
Настройка сбора системных метрик
Создание простых запросов PromQL
Анализ полученных данных

День 2: Prometheus - архитектура и метрики

Теоретическая часть

Архитектура Prometheus
Компоненты и принципы работы
Pull и Push модели
Service Discovery
Retention и хранение данных
Высокая доступность и федерация

PromQL и метрики
Язык запросов Prometheus
Типы метрик (Counter, Gauge, Histogram, Summary)
Основы PromQL синтаксиса
Функции и операторы
Агрегация и группировка данных

Практическая часть

Лабораторная работа 3: PromQL в действии
Практическое изучение PromQL
Создание базовых запросов
Использование функций rate(), increase()
Агрегация метрик по лейблам
Создание сложных запросов для мониторинга

 Лабораторная работа 4: Exporters и Service Discovery
Настройка различных exporters
MySQL Exporter для мониторинга БД
Nginx Exporter для веб-серверов
Настройка Service Discovery в Kubernetes
Автоматическое обнаружение сервисов

День 3: Grafana - визуализация и дашборды

Теоретическая часть

Архитектура Grafana
Возможности и компоненты
Источники данных (Data Sources)
Панели и визуализации
Организация и структура дашбордов
Пользователи и роли

Создание эффективных дашбордов
Принципы дизайна дашбордов
Целевая аудитория и цели
Выбор подходящих визуализаций
Организация информации
Лучшие практики UX/UI

Практическая часть

Лабораторная работа 5: Первый дашборд
Создание базового дашборда
Подключение Prometheus как источника данных
Создание панелей для системных метрик
Настройка временных диапазонов
Добавление аннотаций

Лабораторная работа 6: Продвинутые дашборды
Создание комплексного дашборда
Дашборд для мониторинга приложения
Использование переменных и шаблонов
Создание drill-down навигации
Настройка автообновления

День 4: Alerting и интеграция с Kubernetes

Теоретическая часть

Система алертинга
Alertmanager и правила алертинга
Создание правил в Prometheus
Конфигурация Alertmanager
Группировка и подавление алертов
Интеграция с системами уведомлений

Мониторинг Kubernetes
Специфика мониторинга K8s
kube-state-metrics и cAdvisor
Мониторинг подов, сервисов, деплойментов
Метрики ресурсов и производительности
Логирование в Kubernetes

Практическая часть

Лабораторная работа 7: Настройка алертинга
Создание системы уведомлений
Настройка правил алертинга в Prometheus
Конфигурация Alertmanager
Интеграция с Slack/Email
Тестирование системы алертинга

Лабораторная работа 8: Мониторинг Kubernetes
Развертывание мониторинга в K8s
Установка Prometheus Operator
Настройка ServiceMonitor для приложений
Создание дашбордов для Kubernetes
Мониторинг ресурсов кластера

День 5: Интеграция с CI/CD

Теоретическая часть

Мониторинг CI/CD пайплайнов
Интеграция с GitLab CI/CD
Метрики сборки и деплоймента
Мониторинг производительности пайплайнов
Отслеживание качества кода
Интеграция с системами тестирования

Логирование и трассировка
ELK Stack и Jaeger
Централизованное логирование
Структурированные логи
Распределенная трассировка
Корреляция метрик, логов и трейсов

Практическая часть

Лабораторная работа 9: Интеграция с GitLab
Мониторинг CI/CD процессов
Настройка метрик для GitLab Runner
Мониторинг времени выполнения пайплайнов
Создание алертов на сбои сборки
Дашборд для DevOps команды

Записаться на курс «DO-02 - DevOps-мониторинг»